約 5,842,435 件
https://w.atwiki.jp/dellkeitai/pages/30.html
* シフトJIS JIS8 EBCDIC JIS(78年度版) JIS(83年度版) JEF(富士通漢字) IBM(IBM漢字) KEIS(日立漢字) JIPS(E) JIPS(J) EUC-JP UTF-8 UTF-16 JISのみ Unicode 文字セット UCS-2 2バイト固定(65536文字) UCS-4 4バイトに拡張 Unicode3.1から実際に文字が割り当て エンコーディング UTF-32 4バイト固定 UTF-16 2バイト、または4バイト UCS-2の厳密なスーパーセットで、補助文字(1文字あたり4バイトが必要なサロゲート・ペア)をサポートする。 UTF-8 1~4バイト、日本語は3バイト 参考サイト http //www2d.biglobe.ne.jp/~msyk/cgi-bin/charcode/93.html Java System.out.print("サイズ " + str.getBytes().length); System.out.println("文字数 " + str.length()); 叱(U+20B9F)いう字だとサロゲートペアになるため、lengthだと正しくカウントされない。 1234567890 サイズ 10文字数 10 ABCDEFGHIJ サイズ 10文字数 10 あいうえお サイズ 15文字数 5 アイウエオカキクケコ サイズ 30文字数 10 しかる×5 サイズ 20文字数 10
https://w.atwiki.jp/naobe/pages/43.html
OpenSourceに戻る eclipse Java EE eclipse CDT http //www.eclipsewiki.net/eclipse/?%B5%AF%C6%B0%A5%AA%A5%D7%A5%B7%A5%E7%A5%F3 参照 起動時のJavaVM変更 ...\eclipse.exe -vm c \JDK142_03\jre\bin\javaw.exe 設定 キーバインディング ウィンドウ -- 設定 -- 一般 標準入力の文字化け 対応 eclipse.iniに以下の行を追加 -Dfile.encoding=utf-8 原因 入力文字は、UTF-8なのだが、Shift_JISと解釈して、UTF-8に変換しているため文字化けしている(入力したStringをgetBytes()して文字コードを確認)。 以下を試してみたがNG。Charset.defaultCharset().displayName()を出力すると"UTF-8"であるため、eclipseがInputStreamReaderに入れる前にShift_JIS/UTF-8変換しているのではないだろうか? BufferedReader reader = new BufferedReader(new InputStreamReader(System.in, Charset.forName("UTF-8")));
https://w.atwiki.jp/funf/pages/11.html
ファイル操作には、大きく分けて3種類ある。 文字ストリームのファイル操作(Unicodeだから2バイトごと) バイトストリームのファイル操作 ランダムアクセスできるファイル操作(上の二つとは違う) 文字ストリーム BufferedWriter BufferedWriter bw = new BufferedWriter(new OutputStreamWriter( new FileOutputStream( "fileName", true), "sjis")); bw.write(); FileOutputStreamのtrueをflaseにすると上書き、trueのままだと追記モードです。~ OutputStreamWriterのsjisの部分は文字コードを書く BufferedReader BufferedReader br = new BufferedReader(new InputStreamReader( new FileInputStream("fileName"), "sjis")); br.readLine(); BufferedWriterの読み込み版 LineNumberReader File fp = new File("../log_gesture_0.txt"); LineNumberReader in = new LineNumberReader(new InputStreamReader(new FileInputStream(fp))); String text = in.readLine(); バイトストリーム ランダムアクセス RandomAccessFileを使う
https://w.atwiki.jp/icabmobilemodule/pages/19.html
モジュールは単なるテキストファイルですが、気をつけるべき点が一つあります。 文字コードです。 モジュール内で日本語を使う場合(ダイアログやアプリ名などで)、Shift_JISやEUCなどを使うと正しくインストールされません。 UTF-8(改行コード CRLF)とすることで動作するようです。 ※詳しく調べたわけではありませんが、とりあえずの解決策として。
https://w.atwiki.jp/m_shige1979/pages/777.html
文字コード 設定 [client] default-character-set = utf8 [mysqld] skip-character-set-client-handshake default-character-set = utf8 character-set-server = utf8 collation-server = utf8_general_ci init-connect = SET NAMES utf8 [mysqldump] default-character-set = utf8 [mysql] default-character-set = utf8
https://w.atwiki.jp/taichik15/pages/46.html
文字コードの変更 C-x RET f
https://w.atwiki.jp/nicepaper/pages/108.html
MySQLの文字コードはEUC-JPだが、ファイルはutf-8にしておいて、挿入時にEUC-JPに変更してつっこんでみたいという記事。6月26日記事 目次 MySQLはEUC-JP(ujis)、HTMLファイルもEUCにしてみる。 MySQLの文字コードチェック HTMLファイル等もEUCにしてみる。 トライ UTF-8の文字コードファイルだが、挿入する瞬間にEUC-JPにmb_convert_encodingする。 補足 MySQLはEUC-JP(ujis)、HTMLファイルもEUCにしてみる。 MySQLの文字コードチェック mysql show variables like character_set% ; 結果こんな感じ Variable_name Value character_set_client ujis character_set_connection ujis character_set_database ujis character_set_filesystem binary character_set_results ujis character_set_server ujis character_set_system utf8 character_sets_dir /文字セットディレクトリ/ HTMLファイル等もEUCにしてみる。 !DOCTYPE HTML html lang="ja" head meta charset="euc-jp" 以下略 euc-jpで保存。 この状況で行うと確かに文字化けせずデータベースに格納されていることが確認できました。 トライ UTF-8の文字コードファイルだが、挿入する瞬間にEUC-JPにmb_convert_encodingする。 PDOの利用をする場合 $stmt- bindParam( title , mb_convert_encoding($_POST[ form_title ],"EUC-JP","UTF-8"), PDO PARAM_STR); こんな感じにしておく。 するとEUC-JPで挿入してくれます。 補足 機種依存文字やIBM拡張文字が含まれていると、文字によっては変換できない場合もある。 参考サイト 以上
https://w.atwiki.jp/taropi/pages/18.html
○文字コードの確認方法 kcc -c test.txt
https://w.atwiki.jp/perltips/pages/28.html
Jcodeを使う 例 use Jcode; my $converted = Jcode convert($src, "utf8", "sjis"); この例ではUTF8からSJISへ変換する。 変換された文字列は返り値として得られるが、Jcode convertの場合、引数の$srcも変換されるので注意。 追記 Windowsの機種依存文字を正しく変換するためには、 sjisではなく、cp932を指定すると良い。 参照 http //perldoc.jp/docs/modules/Jcode-0.82/Jcode.pod
https://w.atwiki.jp/rinn/pages/9.html
□postgreSQL 登録されている日本語データを正しく表示させる方法 convert 関数を使います。 convert( データ項目 ," 文字コード "," 文字コード ") 例)UTF-8で登録したデータEUC-JPで表示する例 select convert(kanjiitem, UTF-8 , EUC-JP ) from hogetbl ;